人工智能的盲点:世界顶级大模型在读取识别模拟时钟时间表现惨淡
当今最先进的人工智能模型能够在数学奥林匹克竞赛中夺得金牌,编程能力超越绝大多数专业开发者,却在一个看似简单的任务上遭遇滑铁卢——读取模拟时钟。一项名为ClockBench的新基准测试揭示了人工智能领域的一个令人尴尬的现实:即使是最前沿的AI系统,在这项六岁儿童
模型 人工智能 盲点 时钟 clockbench 2025-09-09 01:58 2
当今最先进的人工智能模型能够在数学奥林匹克竞赛中夺得金牌,编程能力超越绝大多数专业开发者,却在一个看似简单的任务上遭遇滑铁卢——读取模拟时钟。一项名为ClockBench的新基准测试揭示了人工智能领域的一个令人尴尬的现实:即使是最前沿的AI系统,在这项六岁儿童
模型 人工智能 盲点 时钟 clockbench 2025-09-09 01:58 2
AI基准创建者、连续创业者Alek Safar推出了视觉基准测试ClockBench,专注于测试AI的「看懂」模拟时钟的能力。
gemini 推理 llm 时钟 clockbench 2025-09-08 17:12 3